当下热门的开源AI大模型全梳理
去年,OpenAI发布了GPT-3,其千亿参数的规模和惊⼈的语言处理能力给全世界带来了震撼。 之后产业界和学术界迅速投入其中,大量相关的学术研究和应用探索陆续展开,⼀批提供文本生成服务的商业公司也在海外诞生。
不过,OpenAI不Open,很多公司和开发者只能看着干着急,直到Meta站出来发布了LLaMA,为全世界开发者谋了一把福利,自此各类开源AI大模型纷纷冒头,全球进入AIGC时代!
随着AI大模型开源的流行,目前已经涌现了越来越多的开源大型语言模型(LLM)项目,但是不同项目的特点不同,尤其是在能否进行商业化应用方面存在显著差异。基于此,本文就现有的AI⼤模型开源项目,从可商用和可研究两个方向进行了梳理。
𝗕𝗮ize
Baize 是⼀种使⽤LoRA训练的开源聊天模型。它使⽤让 ChatGPT 与⾃⾝聊天⽣成的100k 对话。我们还使⽤Alpaca 的数据来提⾼其性能。我们已经发布了 7B、13B 和
30B 型号。
演⽰链接:https://lnkd.in/g_npB3ut
代码链接:https://lnkd.in/ghCwWeg6
𝗩𝗶𝗰𝘂𝗻𝗮AI
⼀个开源聊天机器⼈,其性能⼏乎与⾕歌的Bard和ChatGPT相同。
演⽰链接:https://chat.lmsys.org/
代码链接:https://lnkd.in/grTJA5G5
𝗞𝗼𝗮𝗹𝗮
Koala 是我们在LLaMA 之上微调的新聊天机器⼈。⼤型语⾔模型 (LLM) 变得简单,EasyLM 是⽤于在 JAX/Flax 中预训练、微调、评估和服务 LLM 的⼀站式解决⽅案。EasyLM 可以利⽤ JAX 的 pjit 功能将 LLM 训练扩展到数百个 TPU/GPU 加速器。 建⽴在 Hugginface 的转换器和数据集之上,这个 repo 提供了⼀个易于使⽤和易于定制的代码库,⽤于训练⼤型语⾔模型,⽽没有许多其他框架的复杂性。EasyLM 是⽤ JAX/Flax 构建的。通过利⽤ JAX 的 pjit 实⽤程序,EasyLM能够通过跨多个加速器共享模型权重和训练数据来训练不适合单个加速器的⼤型模型。⽬前,EasyLM ⽀持单个主机上的多个 TPU/GPU 训练以及 Google Cloud TPU Pod 上的多主机训练。
演⽰链接:https://lnkd.in/gKWAgq58
代码链接:https://lnkd.in/g7Tm_MRq
𝗚𝗣𝗧𝟰𝗔𝗹𝗹
训练基于 LLaMa 的 ~800k GPT-3.5-Turbo 世代的助⼿式 LLM。
代码链接:https://lnkd.in/gB3gKBud
𝗟𝗶𝘁-𝗟𝗟𝗮𝗠𝗔
基于nanoGPT的LLaMA的独⽴实现。
代码链接:https://lnkd.in/gfA5rb4ZAI⼤模型开源现状分析
𝗗𝗼𝗹𝗹𝘆 (𝗗𝗮𝘁𝗮𝗯𝗿𝗶𝗰𝗸𝘀)
Databricks 的Dolly是⼀种指令遵循⼤型语⾔模型,在已获得商业使⽤许可的Databricks 机器学习平台上进⾏训练。基于pythia-12b,Dolly 接受了 databricks dolly-15kDatabricks员⼯在 InstructGPT 论⽂的能⼒域中⽣成的约 15k指令/响应微调记录的训练,包括头脑⻛暴、分类、封闭 QA、⽣成、信息提取、开放 QA 和总结。
dolly-v2-12b不是最先进的模型,但确实表现出令⼈惊讶的⾼质量指令遵循⾏为,⽽不是它所基于的基础模型的特征。Databricks 致⼒于确保每个组织和个⼈都能从⼈⼯智能的变⾰⼒量中受益。Dolly 模型系列代表了我们在这⼀旅程中迈出的第⼀步,我们很⾼兴与全世界分享这项技术。
该模型作为databricks/dolly-v2-12b在 Hugging Face 上可⽤。
代码链接:https://lnkd.in/gw_b2jdf
𝗔𝗹𝗽𝗮𝗰𝗮.𝗰𝗽𝗽
在您的设备上本地运⾏类似 ChatGPT 的快速模型。
代码链接:https://lnkd.in/gDRzZWSc
𝗔𝗹𝗽𝗮𝗰𝗮-𝗟𝗼𝗥𝗔
与text-davinci-003 质量相似的指⽰模型,可在本地设备上运⾏。
演⽰链接:https://lnkd.in/gfh7FM7X
代码链接:https://lnkd.in/gZ5dKGKW
𝗹𝗹𝗮𝗺𝗮.𝗰𝗽𝗽
在纯C/C++中推断LLaMA模型,⽀持LLaMA,Alpaca,GPT4All和Vicuna
代码链接:https://lnkd.in/gkZ8XaJJ
𝗖𝗼𝗹𝗼𝘀𝘀𝗮𝗹𝗖𝗵𝗮𝘁AI
LLM由Colossal-AI驱动的RLHF训练
代码链接:https://lnkd.in/gTezhGXD
补充:Dolly和Lit-LLaMA仅被允许⽤于研究⽤途
ImageBind
Meta 新的开源模型 ImageBind 将多个数据流连接在⼀起,适⽤于⽂本、视频和⾳频等6 种模态。 在⼈类的感官中,⼀张图⽚可以将很多体验融合到⼀起,⽐如⼀张海滩图⽚可以让我们想起海浪的声⾳、沙⼦的质地、拂⾯⽽来的微⻛,甚⾄可以激发创作⼀⾸诗的灵感。图像的这种「绑定」(binding)属性通过与⾃⾝相关的任何感官体验对⻬,为学习视觉特征提供了⼤量监督来源。
代码链接:https://github.com/facebookresearch/ImageBind
04开源大模型评估与选择对于希望以开源项目为基础,进而开发商业产品的公司来说,如何选择开源模型就变得非常关键,除了需要考虑不同模型的特点以外,更需要考虑模型和应用场景的适配性。最近LMSYS Org给出了⼀个可供参考的⽅法,他们直接建立了⼀个竞技场,以众包⽅式让他们匿名、随机的进⾏对抗,形成排行榜。并邀请整个社区加⼊这项⼯作,贡献新模型,所有⼈都可以参与提问和投票来评估它们,判断谁才是最好的模型。END热门文章: